歡迎來到【時間序列分析與預測方法大全】第一篇!
本篇我們會介紹時間序列資料所包含的屬性。
先對資料特性有基本認識後,進入到方法和模型時才不會對各種名詞產生問號哦~
文章同步連載於筆者個人網站:[IT鐵人賽] [Day1] 時間序列分析:時間序列資料屬性拆解 (附程式碼)
時間序列資料可能會是單變量或多變量的,例如:
不同的變量個數,適合的分析/預測方法不同、模型架構也會隨之調整;如果有多個變量,我們就需要關注變量間是否存在相關性。
所有時間序列資料都有 Level 和 Noise 屬性, Trend 和 Seasonality 則不一定存在
根據上述 4 種屬性,可以組合出不同類型的時間序列:
相加型 (Additive):屬性相加所形成的時間序列
相乘型 (Multiplicative):屬性相乘所形成的時間序列,可能為二次、高次或指數方程式
import pandas as pd
import matplotlib.pyplot as plt
data_uri = 'https://raw.githubusercontent.com/jbrownlee/Datasets/master/airline-passengers.csv'
data = pd.read_csv(data_uri, header=0, index_col=0)
data.plot()
plt.show();
根據範例中的時間序列資料,我們推測他更像是 Multiplicative 的時間序列類型
from statsmodels.tsa.seasonal import seasonal_decompose
decomposition = seasonal_decompose(data, model='multiplicative')
decomposition.plot()
plt.show();
由 decomposition plot 可以看到我們的範例時序資料,呈現出了以下特性:
如果你喜歡本系列的整理,還請幫我按讚本文&訂閱我的主題哦!謝謝你的閱讀和回饋!